智能论文笔记

Stochastic smoothing of the top-K calibrated hinge loss for deep imbalanced classification

Camille Garcin , Maximilien Servajean , Alexis Joly , Joseph Salmon

分类： (统计)机器学习 | 机器学习

2022-02-04

在现代分类任务中，标签数量越来越大，实际上遇到的数据集的大小也越来越大。随着班级数量的增加，阶级的歧义和阶级失衡变得越来越有问题，以达到高顶级1的准确性。同时，TOP-K指标（允许K猜测的指标）变得流行，尤其是用于性能报告。然而，提出为深度学习量身定制的Top-K损失仍然是一个挑战，无论是理论上还是实际的。在本文中，我们引入了由Top-K校准损失的最新发展启发的随机TOP-K铰链损失。我们的建议基于在灵活的“扰动优化器”框架上的Top-K操作员建筑的平滑。我们表明，在平衡数据集的情况下，我们的损失函数的性能非常出色，同时，与最先进的TOP-K损失函数相比，计算时间明显低。此外，我们为不平衡案例提出了一个简单的损失变体。在重尾数据集上的实验表明，我们的损失函数显着优于其他基线损失函数。

translated by 谷歌翻译

Industry-Scale Orchestrated Federated Learning for Drug Discovery

Martijn Oldenhof , Gergely Ács , Balázs Pejó , Ansgar Schuffenhauer , Nicholas Holway , Noé Sturm , Arne Dieckmann , Oliver Fortmeier , Eric Boniface , Clément Mayer

分类：机器学习 | (统计)机器学习

2022-10-17

To apply federated learning to drug discovery we developed a novel platform in the context of European Innovative Medicines Initiative (IMI) project MELLODDY (grant n{\deg}831472), which was comprised of 10 pharmaceutical companies, academic research labs, large industrial companies and startups. The MELLODDY platform was the first industry-scale platform to enable the creation of a global federated model for drug discovery without sharing the confidential data sets of the individual partners. The federated model was trained on the platform by aggregating the gradients of all contributing partners in a cryptographic, secure way following each training iteration. The platform was deployed on an Amazon Web Services (AWS) multi-account architecture running Kubernetes clusters in private subnets. Organisationally, the roles of the different partners were codified as different rights and permissions on the platform and administrated in a decentralized way. The MELLODDY platform generated new scientific discoveries which are described in a companion paper.

translated by 谷歌翻译

B2B Advertising: Joint Dynamic Scoring of Account and Users

Atanu R. Sinha , Gautam Choudhary , Mansi Agarwal , Shivansh Bindal , Abhishek Pande , Camille Girabawe

分类：机器学习

2022-09-28

当一家企业向另一家企业（B2B）出售时，购买业务由一组称为帐户的个人代表，他们共同决定是否购买。卖方向每个人做广告，并与他们互动，主要是通过数字方式进行的。销售周期很长，通常在几个月内。在寻求信息时，属于帐户的个人之间存在异质性，因此卖方需要在漫长的视野中对每个人的利益进行评分，以决定必须达到哪些人以及何时达到。此外，购买决定与帐户有关，必须进行评分才能投射购买的可能性，这一决定可能会一直变化，直到实际的决定，象征组决策。我们以动态的方式为帐户及其个人的决定分数。动态评分允许机会在长时间的不同时间点影响不同的单个成员。数据集包含与卖方的每个人通信活动的行为日志；但是，没有关于个人之间咨询的数据，这导致了决定。使用神经网络体系结构，我们提出了几种方法来汇总各个成员活动的信息，以预测该小组的集体决策。多次评估发现了强大的模型性能。

translated by 谷歌翻译

Adversarial Stain Transfer to Study the Effect of Color Variation on Cell Instance Segmentation

Huaqian Wu , Nicolas Souedet , Camille Mabillon , Caroline Jan , Cédric Clouchoux , Thierry Delzescaux

分类：计算机视觉

2022-09-01

由多种因素引起的组织学图像的染色变化不仅是病理学家的视觉诊断，而且是细胞分割算法的挑战。为了消除颜色变化，已经提出了许多染色归一化方法。但是，大多数是为苏木精和曙红染色图像而设计的，并且在免疫组织化学染色图像上表现不佳。当前的细胞分割方法系统地将染色归一化作为预处理步骤，但是尚未定量研究颜色变化带来的影响。在本文中，我们制作了五组具有不同颜色的Neun染色图像。我们应用了一种深度学习的图像录制方法来在组织学图像组之间执行色彩转移。最后，我们改变了分割集的颜色，并量化了颜色变化对细胞分割的影响。结果证明了在后续分析之前必须进行颜色归一化的必要性。

translated by 谷歌翻译

HTML版本

Individual Tree Detection in Large-Scale Urban Environments using High-Resolution Multispectral Imagery

Jonathan Ventura , Milo Honsberger , Cameron Gonsalves , Julian Rice , Camille Pawlak , Natalie L. R. Love , Skyler Han , Viet Nguyen , Keilana Sugano , Jacqueline Doremus

分类：计算机视觉

2022-08-22

我们介绍了一种新颖的深度学习方法，用于使用高分辨率的多光谱空中图像在城市环境中检测单个树木。我们使用卷积神经网络来回归一个置信图，指示单个树的位置，该位置是使用峰查找算法本地化的。我们的方法通过检测公共和私人空间中的树木来提供完整的空间覆盖范围，并可以扩展到很大的区域。在我们的研究区域，跨越南加州的五个城市，我们的F评分为0.735，RMSE为2.157 m。我们使用我们的方法在加利福尼亚城市森林中生产所有树木的地图，这表明我们有可能在前所未有的尺度上支持未来的城市林业研究。

translated by 谷歌翻译

Deep Reinforcement Learning for Multi-Agent Interaction

Ibrahim H. Ahmed , Cillian Brewitt , Ignacio Carlucho , Filippos Christianos , Mhairi Dunion , Elliot Fosong , Samuel Garcin , Shangmin Guo , Balint Gyevnar , Trevor McInroe

分类：人工智能 | 机器学习

2022-08-02

可以与其他代理人互动以完成给定任务的自主代理的发展是人工智能和机器学习研究的核心领域。为了实现这一目标，自主代理研究小组开发了用于自主系统控制的新型机器学习算法，特别关注深度强化学习和多代理强化学习。研究问题包括可扩展的协调代理政策和代理间沟通；从有限观察的情况下对其他代理的行为，目标和组成的推理；以及基于内在动机，课程学习，因果推断和代表性学习的样品学习。本文概述了该小组正在进行的研究组合，并讨论了未来方向的开放问题。

translated by 谷歌翻译

Optimizing transformations for contrastive learning in a differentiable framework

Camille Ruppli , Pietro Gori , Roberto Ardon , Isabelle Bloch

分类：机器学习 | 计算机视觉

2022-07-27

当前的对比学习方法使用从大量转换列表（固定的超参数）中采样的随机转换来从未经注释的数据库中学习不变性。遵循以前引入少量监督的作品，我们提出了一个框架，以找到使用可区分转换网络的对比度学习的最佳转换。我们的方法在监督准确性和收敛速度方面都在低注释的数据制度下提高了性能。与以前的工作相反，转换优化不需要生成模型。转换的图像保留相关信息以解决监督任务，此处分类。在34000 2D切片的大脑磁共振图像和11200胸X射线图像上进行实验。在两个数据集（具有标记数据的10％）上，我们的模型比具有100％标签的完全监督模型获得了更好的性能。

translated by 谷歌翻译

Scalable Bayesian Inference for Detection and Deblending in Astronomical Images

Derek Hansen , Ismael Mendoza , Runjing Liu , Ziteng Pang , Zhe Zhao , Camille Avestruz , Jeffrey Regier

分类： (统计)机器学习

2022-07-12

我们提出了一种新的概率方法，用于检测称为贝叶斯光源分离器（BLISS）的天文来源，进行分类和分类。Bliss基于深层生成模型，该模型将神经网络嵌入贝叶斯模型中。对于后推断，Bliss使用一种新形式的变分推断，称为正向摊销变异推断。幸福推理例程很快，一旦训练了编码器网络，就需要GPU上的编码网络的单个正向通行证。Bliss可以在几秒钟内对百万像素图像执行完全贝叶斯的推断，并产生高度准确的目录。Bliss是高度可扩展的，除了产生概率目录外，还可以直接回答下游科学问题。

translated by 谷歌翻译

Sensitivity Analysis on Transferred Neural Architectures of BERT and GPT-2 for Financial Sentiment Analysis

Tracy Qian , Andy Xie , Camille Bruckmann

分类：自然语言处理

2022-07-07

新型NLP单词嵌入和深度学习技术的爆炸引起了潜在应用的重大努力。这些方向之一是金融部门。尽管在GPT和BERT等最先进的模型中完成了很多工作，但对于这些方法在接受预训练后通过微调的表现以及有关敏感的信息的效果相对较少，相对较少的工作。它们的参数是。我们研究了预先训练的GPT-2和BERT模型转移神经体系结构的性能和灵敏度。我们基于冻结变压器层，批处理大小和学习率测试微调性能。我们发现BERT的参数对微调的随机性过敏，并且在这种实践中GPT-2更加稳定。同样很明显，GPT-2和BERT的较早层包含应维护的基本单词模式信息。

translated by 谷歌翻译

A DSEL for High Throughput and Low Latency Software-Defined Radio on Multicore CPUs

Adrien Cassagne , Romain Tajan , Olivier Aumage , Camille Leroux , Denis Barthou , Christophe Jégo

分类：自然语言处理

2022-06-13

本文介绍了专门针对软件定义无线电（SDR）的新域特异性嵌入式语言（DSEL）。从一组精心设计的组件中，它可以构建有效的软件数字通信系统，能够以简单明了的方式利用现代处理器体系结构的并行性。特别是，提出的DSEL使管道和序列重复技术的组合能够从数字通信系统中提取时间和空间并行性。我们利用了真实用例上的DSEL功能：用于完全在软件中设计的广泛使用的DVB-S2标准的完全数字收发器。通过评估，我们展示了建议的软件DVB-S2收发器如何从现代高端多核CPU目标中获得最大的收益。

translated by 谷歌翻译